量子位 04-10 18:02

大模型能“原地”改参数了!字节Seed&北大新论文:测试时推理无需加层重训练

📌 一句话:字节跳动与北大联合发布突破性技术,让大模型在推理过程中直接修改自身参数,无需重训练或添加新层。

💡 3个要点

  • 字节Seed团队与北大联合提出Test-Time Workshop方法,实现推理时参数更新

  • 打破传统"训练后参数固定"模式,大幅降低计算成本和适配门槛

  • 可在推理过程中动态适应不同任务,尤其擅长处理分布外难题

📖 背景

大语言模型传统上依赖预训练+微调的两阶段范式,参数在训练后固定,适配新任务成本高。

💭 点评

这不仅是技术优化,更是对"模型参数不可变"这一基本假设的挑战。想象一下,如果模型能像人一样边思考边调整认知方式,那AGI或许不再遥远。当然,安全性如何保障、实际部署效果如何,还需观察。但有一点可以确定:AI正在从"学完就用"向"边用边学"进化。

码头码农 - 微信搜索关注